#install.packages("ggplot2")
#install.packages("dplyr")
#install.packages("plotly")

library(plotly)
## Warning: package 'plotly' was built under R version 3.4.4
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.4.4
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(ggplot2)
library(dplyr)
## Warning: package 'dplyr' was built under R version 3.4.4
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readxl)

Гендерний баланс у світових університетах: США, Велика Британія, Німеччина, Японія, Індія,

У своїй статті я вирішила дослідити гендерну динаміку у різних країнах світу. Зокрема, я зосередилася на 3 країнах Західного Світу ,а саме США, Великій Британії та Німеччині. Ці держави, відповідно, представляють рівень життя першого світу із потужною базою університетів. Також, я обрала і три східні країни: Японію, Індію та Китай. Всі вони кардинально різняться, хоча й і знаходяться в Азії. Тому й гендерна динаміка досить різна у вишах цих країн. Розглянемо ці процеси детальніше по кожній країні.

worldunirank <- read_excel("D:/Медіакомунікації/Візуалізація даних/worldunirank.xlsx")
## Warning in read_fun(path = path, sheet = sheet, limits = limits, shim =
## shim, : Expecting numeric in M2312 / R2312C13: got '-'
## Warning in read_fun(path = path, sheet = sheet, limits = limits, shim =
## shim, : Expecting numeric in M2333 / R2333C13: got '-'
## Warning in read_fun(path = path, sheet = sheet, limits = limits, shim =
## shim, : Expecting numeric in M2395 / R2395C13: got '-'
View(worldunirank)



worldunirank <- tbl_df(worldunirank) 

df <- worldunirank

США

Як бачимо на графіку, в США доволі прямолінійна тенденція гендерного балансу в університетах. Впродовж 6 років зберігався між позначками від 40 до 60%, що дозволяє зробити висновки про гендерну рівність у вищих школах Америки. Університети, в яких кількість студентів менше 40%, є технічними, що й пояснює гендерний дисбаланс. Що стосується позначок, які містяться в межах 70%, то це медичні виші. Виходить, що в США спостерігається тенденція збільшення кількості жінок в сфері медицини? Гадаю, цю інформацію треба підкріпити, якщо вже виокремлюємо цю тенденцію. Так от, the Association of American Medical Colleges (AAMC) зробили дослідження у 2015 році, де базуючись на основних даних, виявили, що жінки складають більший відсоток у сімейній медицині (58%), психіатрії(57%), педіатрії (75%) та гінекології (85%). Отож, справді жінки превалюють в медичній сфері США. Джерело: https://wire.ama-assn.org/education/how-medical-specialties-vary-gender

df %>% 
  filter(Country == "United States of America")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))
## Warning: package 'bindrcpp' was built under R version 3.4.4
## # A tibble: 595 x 3
##    University_Name                       `%_Female_Students`  Year
##    <chr>                                               <dbl> <dbl>
##  1 California Institute of Technology                    33. 2011.
##  2 Massachusetts Institute of Technology                 37. 2011.
##  3 Stanford University                                   42. 2011.
##  4 Princeton University                                  45. 2011.
##  5 University of California, Berkeley                    50. 2011.
##  6 Yale University                                       50. 2011.
##  7 University of California, Los Angeles                 52. 2011.
##  8 University of Chicago                                 42. 2011.
##  9 Johns Hopkins University                              50. 2011.
## 10 Cornell University                                    48. 2011.
## # ... with 585 more rows
df1 <- df %>% 
  filter(Country == "United States of America")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))

df1%>%
  group_by(Year) %>%
  summarise(Mean = mean(`%_Female_Students`, na.rm=TRUE)) 
## # A tibble: 6 x 2
##    Year  Mean
##   <dbl> <dbl>
## 1 2011.  49.2
## 2 2012.  49.2
## 3 2013.  49.1
## 4 2014.  49.3
## 5 2015.  49.5
## 6 2016.  50.3
df1 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "navy" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах США", subtitle = 'Динаміка кількості студенток за 6 років')

g <- df1 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "navy" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах США", subtitle = 'Динаміка кількості студенток за 6 років')

g + stat_summary(fun.y=mean, colour="red2", geom="point", aes(group = 1))

gp <- g + stat_summary(fun.y=mean, colour="red2", geom="point", aes(group = 1))
 
 ggplotly(gp, tooltip = c("University_Name"))
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Велика Британія

У Великій Британії також все доволі консервативно. Спостерігаємо подібну тенденцію до США. За 6 років показники переважають в межах 50-60%. Пік кількості студенток, понад 80%, в Royal Veterinary College. Цікаво, що і Imperial Collage London ,і Loughborough University ,де навчається найменше студенток у країні, це дослідницькі інституції.

df %>% 
  filter(Country == "United Kingdom")%>%
  select("University_Name", "%_Female_Students", "Year")%>%  
  filter(!is.na(`%_Female_Students`))
## # A tibble: 286 x 3
##    University_Name                     `%_Female_Students`  Year
##    <chr>                                             <dbl> <dbl>
##  1 University of Cambridge                             46. 2011.
##  2 University of Oxford                                46. 2011.
##  3 Imperial College London                             37. 2011.
##  4 University College London                           56. 2011.
##  5 University of Edinburgh                             58. 2011.
##  6 University of Bristol                               53. 2011.
##  7 "Kinga\u0080\u0099s College London"                 61. 2011.
##  8 University of Sussex                                54. 2011.
##  9 Durham University                                   54. 2011.
## 10 University of Manchester                            52. 2011.
## # ... with 276 more rows
df2 <- df %>% 
  filter(Country == "United Kingdom")%>%
  select("University_Name", "%_Female_Students", "Year")%>%  
  filter(!is.na(`%_Female_Students`))
df2 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "royalblue3" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Великої Британії", subtitle = 'Динаміка кількості студенток за 6 років')

g1 <- df2 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "royalblue3" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Великої Британії", subtitle = 'Динаміка кількості студенток за 6 років')

g1 + stat_summary(fun.y=mean, colour="red2", geom="point", aes(group = 1))

gp1 <- g1 + stat_summary(fun.y=mean, colour="red2", geom="point", aes(group = 1))

 ggplotly(gp1, tooltip = c("University_Name"))
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Німеччина Німеччина не виділяється від інших країн Західного світу. З 2013 по 2016 рр. кількість студенток в більшості університетів складає 45-60%. Менше 40% жінок лише в технічно спрямованих університетах. Як вказано на сайті LMU Munich , де тенденційно навчається 62% студенток, http://www.en.uni-muenchen.de/about_lmu/introducing-lmu/diversity/index.html

df %>% 
  filter(Country == "Germany")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))
## # A tibble: 144 x 3
##    University_Name                `%_Female_Students`  Year
##    <chr>                                        <dbl> <dbl>
##  1 University of GA¶ttingen                       51. 2011.
##  2 LMU Munich                                     62. 2011.
##  3 Heidelberg University                          55. 2011.
##  4 Technical University of Munich                 33. 2011.
##  5 University of Freiburg                         52. 2011.
##  6 University of WA<U+00BC>rzburg                        57. 2011.
##  7 Goethe University Frankfurt                    60. 2011.
##  8 Bielefeld University                           57. 2011.
##  9 University of Bonn                             55. 2011.
## 10 RWTH Aachen University                         31. 2011.
## # ... with 134 more rows
df3 <- df %>%                                    
  filter(Country == "Germany")%>%
  select("University_Name", "%_Female_Students", "Year")%>%
  filter(!is.na(`%_Female_Students`))
df3 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "darkgreen" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Німеччини", subtitle = 'Динаміка кількості студенток за 6 років')

g2 <- df3 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "darkgreen" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Німеччини", subtitle = 'Динаміка кількості студенток за 6 років')

g2 + stat_summary(fun.y=mean, colour="red2", geom="point", aes(group = 1))

gp2 <- g2 + stat_summary(fun.y=mean, colour="red2", geom="point", aes(group = 1))

 ggplotly(gp2, tooltip = c("University_Name"))
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Отож, як ми бачимо в університетах Західного світу (США, Європи, Великої Британії) в основному зберігається гендерна рівність.

Японія

Як відомо, Японія вважається країною наукового прогресу. Тут панує тенденція переваги студентів чоловічої статі в університетах. Відсоток студенток перебуває в межах 30 – 40 %. Подібно до США та Німеччини, найнижчий відсоток студенток в технічних вишах, в Японії – це приблизно 13%. Що цікаво, понад 50% студенток навчаються у медичних університетах (Juntendo University, Tokyo Medical and Dental University, Showa University). Виходить, що Японія повторює гендерні тенденції США в медицині. Джерело NCBI (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5136609/) підтверджує, що дійсно в Японії превалюють жінки в галузі медицини.

df %>% 
  filter(Country == "Japan")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))
## # A tibble: 83 x 3
##    University_Name               `%_Female_Students`  Year
##    <chr>                                       <dbl> <dbl>
##  1 Tokyo Institute of Technology                 13. 2011.
##  2 Osaka University                              31. 2011.
##  3 Tohoku University                             25. 2011.
##  4 Tokyo Institute of Technology                 13. 2012.
##  5 Osaka University                              31. 2012.
##  6 Tohoku University                             25. 2012.
##  7 Nagoya University                             29. 2012.
##  8 Tokyo Metropolitan University                 35. 2012.
##  9 Kyushu University                             28. 2012.
## 10 University of Tsukuba                         38. 2012.
## # ... with 73 more rows
df4 <- df %>%                                    #створюємо нову змінну
  filter(Country == "Japan")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))
df4 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "purple4" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Японії", subtitle = 'Динаміка кількості студенток за 6 років')

g3 <- df4 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "purple4" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Японії", subtitle = 'Динаміка кількості студенток за 6 років')

g3 + stat_summary(fun.y=mean, colour="red3", geom="point", aes(group = 1))

gp3 <- g3 + stat_summary(fun.y=mean, colour="red3", geom="point", aes(group = 1))

 ggplotly(gp3, tooltip = c("University_Name")) #ця штука робить графіки інтерактивними
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Індія

В цій патріархальній країні кардинально інша ситуація. Тут тенденційно кількість студенток і університетах – це 10-20%. Як бачимо,в Індії ще панують традиції старого світу, в тому числі і сексизм та гендерна нерівність. Найвищий показник та ідеальний гендерний баланс простежується тільки в University of Delhi. Цікаво, що цей університет не є далеко найкращим в рейтингу Індії в порівнянні з іншими, хоча й вважається престижним. Зокрема, ректором університету є віце-президент Індії, тут викладають 2 Нобелівські лауреати, університет відвідують відомі люди, в т. ч. і Гілларі Клінтон.

df %>% 
  filter(Country == "India")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))
## # A tibble: 28 x 3
##    University_Name                          `%_Female_Students`  Year
##    <chr>                                                  <dbl> <dbl>
##  1 Indian Institute of Technology Bombay                    16. 2012.
##  2 Indian Institute of Technology Kharagpur                 15. 2013.
##  3 Indian Institute of Technology Bombay                    16. 2013.
##  4 Indian Institute of Technology Roorkee                   17. 2013.
##  5 Panjab University                                        46. 2014.
##  6 Indian Institute of Technology Delhi                     18. 2014.
##  7 Indian Institute of Technology Kanpur                    13. 2014.
##  8 Indian Institute of Technology Kharagpur                 15. 2014.
##  9 Indian Institute of Technology Roorkee                   17. 2014.
## 10 Indian Institute of Science                              19. 2015.
## # ... with 18 more rows
df5 <- df %>% 
  filter(Country == "India")%>%
  select("University_Name", "%_Female_Students", "Year") %>%
  filter(!is.na(`%_Female_Students`))
df5 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "orangered4" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Індії", subtitle = 'Динаміка кількості студенток за 6 років')

g4 <- df5 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "orangered4" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Індії", subtitle = 'Динаміка кількості студенток за 6 років')

g4 + stat_summary(fun.y=mean, colour="royalblue3", geom="point", aes(group = 1))

gp4 <- g4 + stat_summary(fun.y=mean, colour="royalblue3", geom="point", aes(group = 1))

 ggplotly(gp4, tooltip = c("University_Name"))
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Китай

Перейдемо до останньої у нашому дослідження, досить контроверсійної країни, Китаю. Тут відсоток студенток перебуває в межах 30-50%. Така тенденція зберігається впродовж 6 років. Найменше жінок навчається знову ж таки в технічних вишах. А найбільше в медичних школах (Soochow University, Capital Medical University).

df %>% 
  filter(Country == "China")%>%
  select("University_Name", "%_Female_Students", "Year")%>%  
  filter(!is.na(`%_Female_Students`))
## # A tibble: 58 x 3
##    University_Name               `%_Female_Students`  Year
##    <chr>                                       <dbl> <dbl>
##  1 Tsinghua University                           32. 2011.
##  2 Nanjing University                            46. 2011.
##  3 Sun Yat-sen University                        51. 2011.
##  4 Zhejiang University                           41. 2011.
##  5 Tsinghua University                           32. 2012.
##  6 Fudan University                              50. 2012.
##  7 Nanjing University                            46. 2012.
##  8 Sun Yat-sen University                        51. 2012.
##  9 Shanghai Jiao Tong University                 37. 2012.
## 10 Zhejiang University                           41. 2012.
## # ... with 48 more rows
df6 <- df %>% 
  filter(Country == "China")%>%
  select("University_Name", "%_Female_Students", "Year")%>%  
  filter(!is.na(`%_Female_Students`))
df6 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "darkred" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Китаю", subtitle = 'Динаміка кількості студенток за 6 років')

g5 <- df6 %>%
  ggplot(aes(x=Year,y=`%_Female_Students`, group = University_Name))+
  geom_point(alpha= .5, size = 1.2, color = "darkred" )+
  scale_colour_brewer(type = "seq", palette = 1, direction = 1)+
  theme_light()+
  xlab("Рік") +
  ylab("Кількість студенток (%)")+
  labs(title = "Гендерний баланс в університетах Китаю", subtitle = 'Динаміка кількості студенток за 6 років')

g5 + stat_summary(fun.y=mean, colour="royalblue3", geom="point", aes(group = 1))

gp5 <- g5 + stat_summary(fun.y=mean, colour="royalblue3", geom="point", aes(group = 1))


 ggplotly(gp5, tooltip = c("University_Name"))
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

Проаналізувавши Східні університети можна зробити наступні висновки:

Отож, порівнюючи підхід до гендерного балансу на Заході та Сході можемо сказати наступне: